训练数据集

生成式人工智能训练数据集的著作权风险与规制路径

生成式人工智能是基于深度学习等技术预测和生成新内容的人工智能分支,其发展需要算力、算法、数据等关键要素同时推动。从技术逻辑上看,预训练和优化训练中输入的训练数据的数量、质量和类型直接影响生成式人工智能大模型的性能。进行生成式人工智能大模型训练输入的数据应当包含

训练 人工智能 著作权 数据集 训练数据集 2025-09-11 11:40  1

华盛顿大学推出VisualSphinx视觉逻辑训练数据集

在人工智能快速发展的今天,视觉语言模型(VLMs)展现出了令人印象深刻的能力,无论是生成图像描述、回答关于图像的复杂问题,还是根据文字描述创建图像。然而,这些模型在需要结构化逻辑推理的视觉任务上仍显示出明显的不足。这一局限性严重制约了它们在图表理解和多模态决策

数据集 华盛顿大学 v 训练数据集 visualsphinx 2025-06-05 23:38  9